Calificación automática de C++ con BART y rúbricas
Descubre cómo mejora la calificación automática de tareas C++ con BART y rúbricas: menor error y distribuciones de notas más realistas.
Descubre cómo mejora la calificación automática de tareas C++ con BART y rúbricas: menor error y distribuciones de notas más realistas.
Descubre BaltiVoice, el primer corpus de voz público para el idioma balti. Ajustamos Whisper y reducimos el error de 182% a 30%. ¡Modelo y demo disponibles!
¿Aprenden los LLM a representar el modelo del mundo al planificar? Este análisis revela cómo el ajuste supervisado codifica la validez de acciones y predicados.
Descubre SEFT, un método de ajuste fino que permite a los LLMs dispersos evolucionar su estructura manteniendo eficiencia. Supera a métodos existentes.
FGRPO optimiza modelos de razonamiento con agregación adaptativa en datos no IID, preservando privacidad.
Descubre DECA, el ajuste fino completo descentralizado para LLMs con Adam por bloques y datos no IID.
Descubre DECA: ajuste fino completo descentralizado de LLMs en datos no IID. Eficiente y rápido. ¡Infórmate!
Descubre ParaBlock: una técnica innovadora que acelera el aprendizaje federado de grandes modelos de lenguaje al paralelizar comunicación y computación, manteniendo el rendimiento.
Poda de redes profundas con distribución Marchenko-Pastur: precisión mantenida con mínimo ajuste fino. Resultados en ImageNet con ViT y CNNs.
Aplica protocolos de evaluación basados en pruebas de aceptación para sistemas LLM seguros, confiables y alineados con el negocio.
Descubre GRZO, el optimizador que reduce la varianza en el ajuste fino de LLMs, mejorando precisión y ahorrando memoria GPU.
Descubre TypewriterLM, un modelo de lenguaje de 7.24B parámetros entrenado con textos anteriores a 1913. Supera desafíos de calidad y fuga temporal.
Aprende a hacer fine-tuning del modelo LFM2 con QLoRA y DPO en Google Colab. Tutorial paso a paso con código abierto. ¡Mejora tu IA!
Optimiza el ajuste fino de modelos grandes con adaptadores Kronecker. Conoce CDKA, una nueva técnica que mejora la capacidad y eficiencia mediante el diseño estratégico de componentes.
Descubre MeSP: reduce un 49% la memoria al ajustar LLMs en dispositivos, con gradientes exactos. Ideal para entrenamiento privado.
Descubre MARFT, un nuevo marco de ajuste fino por refuerzo multi-agente para optimizar sistemas de agentes LLM. Mejora colaboración y razonamiento.
GFlowGR utiliza GFlowNets para ajustar sistemas de recomendación, mitigando el sesgo de exposición. Mejora diversidad y precisión. Optimiza tu modelo.
Descubre cómo PFT mejora un 55% las propiedades fonónicas de materiales al ajustar potenciales interatómicos con IA. Nuevo estándar en simulaciones.
Los modelos de difusión enmascarada (MDLM) son sensibles a pequeños desplazamientos posicionales. Descubre cómo CTC mejora el ajuste fino y supera a la entropía cruzada en cuatro benchmarks.
OP-LoRA mejora el rendimiento de LoRA al añadir MLP temporal que se descarta. Logra hasta 15 puntos más en generación de imágenes.